Clasificación de textos adaptada para Conversión de Texto en Habla Multidominio

نویسندگان

  • Francesc Alías
  • Xavi Gonzalvo
  • Xavier Sevillano
  • Joan Claudi Socoró
  • José Antonio Montero
  • David García
چکیده

This paper introduces a text classification system tuned to cope with the requirements of multi-domain text-to-speech synthesis. This method, based on a previous system which represents texts by means of a weighted graph, has been developed to improve the classification efficiency for small texts and to minimize its computational cost. To that effect, the comparison space is built from the input text instead of being built from the training documents. Classification experiments conducted on an advertising text corpus show the achievement of the posed goals.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Clasificación de actos de habla en diálogos basada en los verbos de habla

Resumen. En este artículo presentamos la clasificación de los actos de habla para el manejo de diálogos que usa como base la clasificación de los verbos de habla presente en los lenguajes naturales. Consideramos dos clasificaciones de los verbos de habla en español y realizamos su comparación. Observamos que a pesar de las diferencias en los niveles altos de las clasificaciones, los niveles baj...

متن کامل

Clasificación semántica de textos no estructurados mediante un enfoque evolutivo

Resumen. En la actualidad, cerca del 90% de la información se encuentra plasmada tanto en documentos estructurados como no estructurados. Esto ha dado impulso a la investigación e implementación de diferentes algoritmos para el análisis y clasificación de textos de acuerdo a su orientación semántica. Por ello, en el presente trabajo se describe una manera de clasificación de textos no estructur...

متن کامل

Presentación sinóptica de textos bilingües mediante distancias de edición

Resumen Aunque la alineación de textos multilingües mediante métodos de traducción estadística consigue buenos resultados, su implementación es compleja y su fundamentación teórica es, a menudo, intrincada. En el caso de textos escritos en idiomas emparentados (por ejemplo, el latín y el castellano) hemos conseguido resultados satisfactorios usando programas muy simples basados en la distancia ...

متن کامل

Codificación (s, c)-Densa: optimizando la compresión de texto en lenguaje natural

Resumen Este trabajo presenta un nuevo método para la compresión de textos, que permite la búsqueda directa de palabras y frases dentro del texto sin necesidad de descomprimirlo. Este método es directamente comparable, en tasa de compresión, con las técnicas basadas en Huffman orientadas a palabras y proporciona una compresión más simple y rápida, manteniendo sus caracteŕısticas más destacables...

متن کامل

Arquitectura para conversión texto-habla multidominio

this paper presents an evolution in the design of multi-domain unit selection text-to-speech (MD-TTS) architecture. The goal of this approach is to achieve good synthetic quality like the limited domain TTS systems, without discarding a general purpose synthesis. The multi-domain architecture entails a speech corpus containing several domains. Moreover, it has been hierarchically structured by ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • Procesamiento del Lenguaje Natural

دوره 37  شماره 

صفحات  -

تاریخ انتشار 2006